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PCT/EP 0 2 / 1 0 08 4 

Titel: Rekonf igurierbares System 



Beschreibuag 

Die vorliegende Erfindung betrifft das oberbegrif f lich Bean- 
spruchte. Damit befafit sich die vorliegender Erfindung mit 
der Frage, wie ein rekonf igurierbarer Processor auf besonders 
gtinstige Art und Weise mit einem Standardprozessor verbunden 
werden kann. 

Onter einer rekonf igurierbaren Architektur werden vorlieg.end 
Bausteine (VPU) mit konf igurierbarer Funktion und/oder Ver- 
netzung vsrstanden, insbesondere integrierte Bausteine mit 
einer Mehrzahl von ein- oder mehrdimensional angeordneten 
arithmetischen und/oder logischen und/oder analogen und/oder 
speichernden und/oder intern/extern vernetzenden Baugruppen, 
die direkt oder durch ein Bussystem miteinander ve'rbunden 
sind. 

Zur Gattung dieser Bausteine zahlen insbesondere systolische 
Arrays, neuronale Netze, Mehrprozessor Systeme, Prozessoren 
mit mehreren Rechenwerken und/oder logischen Zellen und/oder 
koinmunikativen/peripheren Zellen (IO) , Vernetzungs- und Netz- 
werkbausteine wie 2.B. Crossbar-Schalter, ebenso wie bekannte 
Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc. 
Hingewiesen wird insbesondere in diesem Zusammenhang auf die 
folgenden Schutzrechte und Anmeldungen desselben Anmelders: 
P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, 
DE 196 54 846.2-53, DE 196 54 593.5-53, DE 197 04 044.6-53, 
DE 198 80 129.7, DE 198 61 088.2-53, DE 199 80 312.9, 
PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 
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DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, 

EP 01 102 674.7, DE 196 51 075.9-53, DE 196 54 846-2-53, 

DE 196 54 593.5-53, DE 197 04 728.9, DE 198 07 872.2, 

DE 101 39 i70.6, DE 199 26 538.0, DE 101 42 904.5, 

DE 101 10 530.4, DE 102 02 044.2, DE 102 06 857.7, 

DE 101 35 210.7-53, EP 02 001 331.4, 60/317,876. Diese sind 

hiermit zu of f enbarungszwecken vollumf anglich eingegliedert- 

Die o.g. Architektur wird beispielhaft zur Verdeutlichung 
herangezogen und im folgenden VPU genannt . Die Architektur 
besteht aus beliebigen arithmetischen, logischen (auch Spei- 
cher) und/oder Speicherzellen und/oder Vemetzungszellen 
und/oder kommunikativen/peripheren (IO) Zellen (PAEs) , die zu 
einer ein- oder mehrdimensionalen Matrix (PAC) angeordnet 
sein kftnnen, wobei die Matrix unterschiedliche, beliebig aus- 
gestaltete Zellen aufweisen kann; auch die Bussysteme werden 
dabei als Zellen verstanden. Der Matrix als Ganzes oder Tei- 
len davon zugeordnet ist eine Konf igurationseinheit (CT) , die 
die Vernetzung und Funktion des PA beeinflufit. 

Aufgabe der Erfindung ist as, Neues fur die gewerbliche Nut- 
zung bereitzustellen. 

Die Losung der Aufgabe wird unabhangig beansprucht. Bevorzug- 
te Ausftthrungsformen finden sich in den Unteranspruchen. 

Ein rekonf igurierbarer Prozessor (VPIJ) wird demnach in eine 
technische Umgebung hineinentworfen, die einen Standardpro- 
zessor (CPU) besitzt, wie beispielsweise einen DSP, RISC, 
CISC-Prozessor oder (Mikro) -Kontroller aufweist. Das Design 
erfolgt dabei derart, dass eine moglichst einfache und den- 
noch sehr leistungsf ahige Anbindung besteht. Ein weiterer 
Aspekt, der sich ergibt, ist die einfache Programmierung des 
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entstehenden Systems. Die Weiterverwendung bestehender Pro- 
gramme der CPU sowi* die Codekompatibilitat and die einfache 
Integration der VPU in bestehende Programme f inden durch das 
beschriebene Verfahren problemf rei Berticksichtigung. 



Stand, der Teclinik 

Rekonfigurierbare Bausteine (VPUs) unterschiedlicher Gattun- 
gen (wie z. B. PACT XPP-Technologie, Morphics, Morphosys, 
Chameleon) sind zu bestehenden technischen Dmgebungen und 
Programmierverfahren weitgehend inkompatibel - 

Die Programme der Bausteine sind «eiter inkompatibel zu be- 
reits bestehenden Programmen von CPUs . Dadurch wird ein er- 
heblicher Entwicklungsaufwand zur Programmierung erforder- 
lich z B besonders fur Bausteine der Gattungen Morphics, 
Morphosvs. Chameleon integriert bereits einen Standardprozes- 
S or (ARC) auf den rekonf igurierbaren Bausteinen. Dadurch ste- 
hen Tools zur Programmierung zur Verfugung. Allerdings ist 
nicht jede technische Umgebung fur den Einsatz von ARC 
Prozessoren geeignet, insbesondere liegen bestehende Program- 
me, Codebibliotheken etc. oftmals fur beliebige unbest^mmte 
andere CPUs vor. 



Besehreibung der Erfiindung 

Eine VPU (oder ohne jeweils besonders erwahnt zu werden, meh- 
rere VPUs) wird derart mit einer bevorzugten CPU gekoppelt, 
dass sie dort die stall, und Funktion eines Coprozessors ein- 
, nimmt. Die Funktion als Coprozessor ermoglicht dabei die ein- 
fache Einbindung in bestehende Programmcodes entsprechend den 
bereits existierenden Methoden zum Umgang mit Coprozessoren 
nach dem Stand der Technik. 

3 
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Das System kann insbesondere als (Standard) -Prozessor oder 
Baugruppe ausgestaltet sein und/oder in einem Halbleiter (Sy- 
stem on Chip SoC) integriert sein. 

Um die Coprozessor-Anbindung zwischen CPU und VPU vorzusehen, 
ist ein Daten- bzw. Inf ormationsaustausch zwischen CPU und 
VPU erforderlich- Insbesondere mufi der Prozessor der Copro- 
zessor-Einheit typisch Daten und Anweisungen ilbermitteln, was 
mit diesen geschehen mufi. Der Datenaustausch zwischen CPU und 
VPU kann nun mittels Speicherkopplung und/oder IO-Kopplung 
erfolgen- CPU und VPU konnen dabei prinzipiell samtliche Res- 
sourcen teilen; in besonderen Ausgestaltungen ist es hingegen 
auch moglich, dafi. CPU und VPU nur einen Teil der Ressourcen 
gemeinsam verwenden, wahrend andere Ressourcen jeweils expli- 
zit und exklusive ftlr die CPU Oder VPU zur Verfugung stehen. 
Die Frage, welche Variants bevorzugt ist, wird typisch unter 
anderem von der Gesamtauslegung des Systems, den moglichen 
Kosten, verfugbaren Ressourcen, der erwarteten Datenlast usw. 
abhangen. Es sei darauf hingewiesen, daB dort, wo auf eine 
einzelne CPU Bezug genommen wurde und wird, auch mehrere CPUs 
gemeinsam angesprochen werden konnen. 

Um einen Datenaustausch durchzufiihren, konnen Datensatze 
und/oder Konf igurationen in jeweils besonders dafur vorgese- 
hen Speicherbereiche kopiert bzw. geschrieben/gelesen werden 
und/oder entsprechende Basisadressen so gesetzt werden, dafi 
diese auf die jeweiligen Datenbereiche zeigen. 

Zur Steuerung des Coprozessors wird nun in einer bevorzugten 

Variante ein Datensatz vorgesehen, der beispielsweise die 

Grundeinstellungen einer VPU beeinhaltet, wie beispielsweise 

bestimmte Basisadressen. Des weiteren konnen Statusvariablen 
4 
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zur Ansteuerung und Funktionsst^uerung einer vpu durch eine 
CPU iiu Datensatz bzw. ftir die separate Obertragung vorgesehen 
sein und mit oder getrennt von Daten ausgetauscht warden- In 
einer besonders bevorzugten Variante konnen die Adressen fie- 
5 xibel verteilt und zugewiesen werden- Bevorzugt braucht somit 
lediglich eine Grundadresse im I/O- oder Speicheradressraum 
fest vereinbart zu werden / um mit ihrem Datensatz als Zeiger 
auf die flexibel definierten Adressen zu dienen. * 

10 Der Datensatz kann iiber einen gemeinsamen Speicher {RAM) 
und/oder Uber einen gemeinsamen peripheren Adressraum (10) 
^ ausgetauscht warden- Die Adressen konnen flexibel verteilt . 

und zugewiesen werden. 

15 Zur Synchronisation der CPU und VPU konnen einseitig oder ge- 
genseitig Interruptverf ahren (z. B. Inter ruptleitungen) vor- 
gesehen sein und/oder die Synchronisation erfolgt mittels 
Pollingverf ahren- Weiterhin konnen Interrupts zur Synchroni- 
sation von Daten- und/oder DMA-Transfers verwendet werden. In 

20 einer besonders zu bevorzugenden Ausgestaltung wird eine VPU 
durch eine CPU gestartet und arbeitet danach unabhangig die 
gestarte.te bzw. angewiesenen Applikation ab. 

, Besonders leistungsf ahig ist ein bevorzugter Aufbau, bei wel- 

25 chen die verwendete VPU eigene Mechanismen zum Laden und Kon- 

trollieren von Konf igurationen vorsieht* Zur Gattung dieser 

VPUs gehoren beispielsweise PACT XPP und Chameleon. Die er- 

f indungsgemalien Schaltungen ermoglichen ein Verfahren zum Be- 

trieb derart, daft alle Konf igurationen der VPU oder ein Teil 

30 der VPU-Konf igurationen zusammen mit dem aus2uf\ihrenden Pro- 

gramm der CPU in einen Speicher geladen werden. Die CPU kann 

wahrend der Ausftihrung des Programmes die VPU auf die Spei- 

cherstellen verweisen (z. B. durch Angabe der Adressen oder 

5 
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Pointer), die die jeweils auszufuhrenden Konf igurationen be- 
inhalten. Die VPU kann daraufhin die Konf igurationen selb- 
standig und ohne weitere Einflufinahme durch die CPU laden. 
Wenn and soweit die VPU, d- h. das rekonf igurierbare Feld mit 
insbesondere grobgranular lauf zeitkonf igurierbaren Elementen 
eine Ladelogik zum Laden von Konf igurationen besitzt, kann es 
ausreichen, wenn der Prozessor an die CPU die Anweisung aus- 
gibt, eine bestimmte Konf iguration zu Laden. Der Aufruf des 
dann als Coprozessor dienenden rekonf igurierbaren Prozessors 
kann also bevorzugt iiber einen einzigen Befehl an die Ladelo- 
gik erfolgen. Es sei darauf hingewiesen, daft durch vorberige 
Vereinbarung zwischen VPU und CPU, also dem aufruf enden Host- 
Prozessor, genau festgelegt werden kann, welche Konf iguration 
durch welchen Aufruf auszufuhren ist. Daft hierbei entspre- 
Chende Steuenuittel in der Ladelogikeinheit, sei sie dedi- 
ziert, implementiert oder durch ein oder mehtere rekonfigu- 
rierbare Zellen des rekonf igurierbaren Prozessors gebildet, 
vorgesehen sein konnen, sei erwahnt. Das Ausfuhren startet 
sofort oder ggf. durch eine zusatzliche Information (z.B. In- 
terrupt und/oder Start Befehl) durch die CPU- 

in einer besonders bevorzugten Erweiterung kann die VPU selb- 
standig innerhalb eines oder mehrerer Speicher(s), von denen 
einige jeweils gemeinsam mit oder unabhangig von der CPU 
sein konnen, Daten lesen und schreiben. 

in einer besonders bevorzugten Erweiterung kann die VPU eben- 
falls selbstandig neue Konf igurationen aus dem Speicher laden 
und sich bei Bedarf neu konf igurieren, ohne dali es eines wex- 
j . teren Einflusses durch die CPU bedarf. 

Diese Ausgestaltungen ermogliohen einen weitestgehend von 
CPUs unabhangigen Betrieb von VPUs. Lediglich ein Synchros- 
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sationsaustausch zwischen CPU und VPU, der bevorzugt bidirek- 
tional stattfinden kann, sollte zusatzlich vorgesehen werden, 
um die Datenverarbeitungen und/oder Konfigurationsausfiihrun- 
gen aufeinander abzustimmen. 

5 

Grundsatzlich kann die Ablauf steuerung einer VPU zwar direkt 
von einem auf der CPU ausgefuhrten Programm erfolgen, das 
quasi das Hauptprogramm darstellt, das bestimmte Unterpro- 
gramme auf die VPU auslagert. Dies ist eine besonders einfach 
10 zu implement ierende Variante. 

Bevorzugt werden jedoch zur Synchronisation und Ablaufsteue- 
rung iiber das Betriebssystem (insbesondere den Scheduler) ge- 
steuerte Mechanismen verwendet. Ein einfacher Scheduler kann 
15 nach Ubertragung der Funktion auf die VPU, insbesondere wo 
moglich, 

1. das aktuelle Hauptprogramm auf der CPU weiterlaufen las- 
sen, sofern dieses unabhangig und parallel zur Datenver- 

20 arbeitung auf einer VPU ablaufen kann, 

wobei auch und/oder alternative 

2. sofern oder sobald das Hauptprogramm auf die Beendigung 
der Datenverarbeitung auf der VPU warten mufi, der Task- 
scheduler auf einen anderen Task {z. B. ein anderes 

25 Hauptprogramm) umschaltet. Die VPU kann dabei unabhangig 

von dem gerade aktuellen CPU-Task im Hintergrund weiter- 
arbeiten- 

Jeder neu aktivierte Task wird typisch, sofern er die VPU 
30 verwendet, vor Verwendung prttfen, ob diese fur eine Datenver- 
arbeitung zur Verfugung steht oder aktuell noch Daten in ei- 
ner Weise verarbeitet, welche die benotigten VPU-Ressourcen 

blockiert; dann mufi entweder auf die Beendigung der Datenver- 
— 7 
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arbeitung gewartet Oder/ falls etwa nach Prioritat bevorzugt, 
der Task gewechselt werden.. 

Ein einfaches und dennoch leistungsf &higt*s Verfahren kann 
5 insbesondere durch sogenannte Descriptor Tables aufgebaut 

bzw. realisiert werden, die bespielsweise folgendermafien rea- 
lisiert werden kSnnen: 

Jeder Task generiert zutt Aufruf der VPU eine oder mehrere Ta- 
10 belle (n) (VPUPROC) mit einem geeigneten festgelegten Daten- 
forniat in dem ihrn zugewiesenen Speicherbereich. Diese Tabelle 
beeinhaltet s&mtliche Steuerinf ormation fur eine VPU, wie 
2.B. das auszuf iihrende Programm / die auszufiihrende Konfigu- 
ration (oder Zeiger auf die entsprechenden Speicherstellen) 
15 und/oder Speicherstelle (n) (oder jeweils • Zeiger darauf) 

und/oder Datenquellen (oder jeweils Zeiger darauf) der Ein- 
gangsdaten und/oder die Speicherstelle (n) (oder jeweils Zei- 
ger darauf) der Operanden oder der Ergebnisdaten. 

20 Im Speicherbereich des Betriebssystems kann sich beispiels- 
weise eine Tabelle oder verkettete Liste (LINKLIST) befinden, 
die auf samtliche VPUPROC-Tabellen in der Reihenfolge ihrer 
Erstellung und/oder Aufrufs zeigt. 

25 Die Datenverarbeitung auf der VPU lauft nunmehr bevorzugt 

derart ab, daft ein Hauptprograrnm einen VPUPROC erstellt und 
iiber das Betriebssystexn die VPU aufruft. Das Betriebssystem 
erstellt einen Eintrag in der LINKLIST. Die VPU arbeitet die 
LINKLIST ab und fuhrt die jeweils ref erenzierten VPUPROC aus. 

30 Die Beendigung einer jeweiligen Datenabarbeitung wird dann 

bevorzugt jeweils durch einen entsprechenden Eintrag in die 

LINKLIST und/oder VPUCALL Tabelle angezeigt, den die CPU z. 

B. durch regelmafiiges Pollen abfragen kann. Alternativ konnen 

8 
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Interrupts von der VPU z.ur CPU als Anzeige und ggf . auch zum 
Austausch des VPU-Status verwendet werden; dabei ist nicht 
nur moglich, das Erreichen des Programmendes anzuzeigen; 
vielmehr kann auch angezeigt werden^ daii und gegebenenf alls 
5 welcher Punkt im Unterprogramm bereits erreicht wurde* 

Die VPU arbeitet in diesem erf indungsgemSfi bevorzugten Ver- 
fahren weitgehend unabh&ngig von der CPU . Insbesondere konnen 
die CPU und die VPU unabhangige und unterschiedliche Tasks je 
10 Zeiteinheit ausfiihren. Das Betriebs system und/oder die jewei- 
ligen Tasks miissen lodiglich die Tabellen (LIWKLIST bzw. VPU- 
PROC ) lib e rwa ch en - 

Alternativ kann auch auf die LINKLIST verzicht^t werden, in- 
15 dem die VPUPROCs untereinander durch Pointer verkettet wer- 
den, wie es aus Listen bekannt ist. Abgearbeitete VPU- 
PROCs werden aus der Liste ^ntfernt, neue in die Liste einge- 
fQgt. Das Verfahren ist Programmierern bekannt und mufi daher 
nicht weitergehend ausgefuhrt werden* 

20 

Der Aufbau einer besonders bevorzugten VPU ist in Figur 1 
dargestellt . Vorzugsweise hierarchische Konf igurationsmanager 
(CT's) (0101) steuern und verwalten eine Anordnung von rekon- 
f igurierbaren Eleittenten (PACs) (0102) ~ Den CT's ist ein loka- 

25 ler Speicher ftir die Konf igurationen zugeordnet (0103) . Der 
Speicher verftigt weiterhin iiber ein Interface (0104) zu einem 
globalen Speicher, der die Konf igurationsdaten 2ur Verftigung. 
stellt. Ober ein Interface (010S) sind die Konf igurationsab- 
lSufe steuerbar> Ein Interface der rekonf igurierbaren Elemen- 

30 te (0102) zur Ablauf steuerung und Ereignisverwaltung (0106) 
ist vorhanden, ebenso ein Interface zum Datenaustausch 
(0107) . 

9 
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Figur 2 zeigt einen Ausschnitt aus einem beispielhaften CPU- 
System, beispielsweise einem DSP des Types C6000 von Texas 
Instruments oder ein Mikrokontroller von ARM (0201) . Darge- 
stellt sind Programmspeicher (0202), Datenspeicher (0203), 
5 beliebige Peripherie (0204) und EMIF (0205) . Ober einen Spei- 
cherbus (0206) und einen Peripheriebus (0207) ist eine VPU 
als Coprozessor integriert (0208) . Ein DMA-Kontroller (EDMA) 
(0209) kann beliebige DMA-Transfers, beispielsweise zwischen 
Speicher (0203) und VPU (0208) oder Speicher (0203) und Peri- 

10 pherie (0204) durchftthren. Prinzipiell kann auch die VPU 

und/oder CPU selbstandig ohne Zuhilfenahme eines DMAs auf den 
Speicher zugreifen. Der gemeinsame Speicher kann insbesondere 
auch als Dualport- oder Multiportspeicher ausgestaltet sein. 
Dem System kfinnen weitere Baugruppen zugeordnet werden, ins- 

15 besondere konnen rekonf igurierbare FPGAs eingesetzt werden, 
urn eine f eingranulare Verarbeitung einzelner Signale oder Da- 
tenbits zu ermoglichen und/oder flexible adaptierbare Inter- 
face (z.B. diverse serielle Schnittstellen (V24, USB, etc.). 
diverse parallele Schnittstellen, Festplattenschnittstellen, 

20 Ethernet, Telekommunikationsschnittstellen (a/b, TO, ISDN, 
DSL, etc) ) aufbauen zu konnen* 

Figur 3 zeigt eine abstraktere Systemdef inition- Einer CPU 
2S (0301) ist Speicher (0302) zugeordnet, auf den diese schrei- 
benden und/oder lesenden Zugriff besitzt. Eine VPU (0303) ist 
mit dem Speicher gekoppelt. Die VPU ist in einen CT-Teil 
(030 9) und die rekonf igurierbaren Elemente zur Datenverarbei- 
tung (0310) untergliedert . 

30 

2ur Steigerung der Speicherzugrif f e kann der Speicher mehrere 
unabhangige, unter Umstanden gleichzeitig, verwendbare Zu- 
grif fsbusse aufweisen (multiport) . In einer besonders bevor- 

10 
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zugten Ausgestaltung ist der Speicher in mehrere unabhangige 
Segmente (Speicherbanks) segment iert, wobei auf jede Bank un- 
abhangig zugriffen werden kann„ Samtliche Segmente liegen 
vor2ugsweise innerhalb eines einheitlichen Adressraums. 

5 

Vorzugsweise steht ein Segment hauptsSchlich fur die CPU zur 
Verftigung (0304), ein weiteres Segment steht hauptsachlich 
fur die Datenverarbeitung der VPU zur Verfiigung (0305) , ein 
weiteres Segment steht hauptsSchlich fur die Konf igurations- 
10 daten der VPU zur Verfttgung (0306) - 

) Typischerweise und bevorzugt weist eine vollausgestaltete VPU 

eigene Adressgeneratoren und/oder DMAs auf, um Datentransfers 
durchzuftihren. Alternativ und/oder zusStzlich ist es mBglich, 
15 dass ein DMA (0307) innerhalb des Systems (Fig- 3) far Daten- 
transfers mit der VPU vorgesehen ist- 

Das System enthalt IO-Mittel (0309) , auf die CPU und VPU Zu- 
griff haben konnen. 

Sowohl CPU als auch VPU konnen jeweils dedizierte Speicherbe- 
20 reiche und IO-Bereiche aufweisen, auf die der jeweils andere 
keinen Zugriff hat. 

Ein Datensatz (0311) der, wie graphisch dargestellt, im Spei- 
cherbereich und/oder im IO-Bereich und/oder partiell in einem 
1 von beiden liegen kann, wird zur Kommunikation zwischen CPU 

25 und VPU verwendet, z. B. zum Austausch von Basisparametern 

und Steuerinf ormation. Der Datensatz kann beispielsweise fol- 
gende Information beeinhalten und stellt somit einen Grund- 
einstellungsdatensatz dar: 

1. Basisadresse (n) des CT-Speicherbereiches in 0306 zur Lo- 
30 kalisierung der Konf igurationen, 

2 - Basisadresse (n) von Datentransf ers mit 0305, 
3. I/O-Adressen von Datentransf ers mit 0308, . 

— n 
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4. Synchronisationsinformation, 2, B. Zurticksetzen, Anh'al- 
ten, Starten der VPU, 

5. Statusinformation der VPU, z. B. Fehler Oder Zustand der 
Datenverarbeitung . 

5 6. 

Die Synchronisation der CPU und VPU erfolgt durch Polling von 
Statusdaten und/oder -inf ormationen und/oder bevorzugt durch 
Interruptsteuerung (0312) . 

10 Der Grundeinstellungsdatensatz kann eine LINKLIST und/oder 

VPUCALLs enthalten, Oder alternativ auf die LINKLIST und/oder 
VPUCALLs oder den jeweils ersten Eintrag derer durch Pointer 
2eigen. 

15 Figur 4 zelgt eine mogliche Ausgestaltung der Interf acestruk- 
tur einer VPU zur Einbindung in ein System &hnlich Figur 3. 
Dazu werden der VPU ein Speicher/DMA- und/oder IO-Interface 
zuiti Datentransfer zugeordnet (0401) ; ein weiteres System- 
Interface (0402) abernirnmt die Ablauf steuerung wie z. B. das 

20 Verwalten von Interrupts , das Starten/Stoppen der Verarbei- 
tung, Austausch von Fehlerzust&nden, etc. 

Das Speicher/DMA- und/oder IO-Interface wird an einen Spei- 
cherbus und/oder IO-Bus angeschlossen. 

Das System-Interface wird vorzugsweise an einen IO-Bus ange- 
25 schlossen, kann jedoch alternativ oder zusatzlich entspre- 
chend 0311 auch an einen Speicher angeschlossen sein. 
Die Interface (0401/ 0402) konnen zur Anpassung von unter- 
schiedlichen Arbeitsf requenzen von CPU und/oder VPU und/oder 
System ausgestaltet sein und eine Taktanpassungsschaltung 
30 aufweisen/ beispielsweise kann das System bzw. die CPU mit 
4 00MHz und die VPU mit 200MHz arbeiten. 

Die Interface konnen mit einer Protokollanpassungsschaltung 

eine Ubersetzung der Eusprotokolle durchfiihren, beispielswei- 

12 
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se kann das VPU interne Protokoll auf ein externes AMBA- 
Busprotokoll umgesetzt werden und umgekehrt. 

Das Speicher/DMA- und/oder IO-Interface untersttitzt den Spei- 
cherzugriff der CT auf einen externen Speicher, der vor2ugs- 

5 weise direkt (memory mapped) erfolgt- Der Datentransf er der 
CT(s) und/oder PAC(s) kann gepuffert z. B. uber FIFO-Stufen 
erfolgen. Externer Speicher (2-B. 0308 , 0203) kann direkt an- 
gesprochen und adressiert werden, weiterhin konnen DMA inter- 
ne und/oder exteme DMA-Transfers durchgefiihrt werden - 

10 tJber das System-Interface erfolgt die Steuerung der Datenver- 
arbeitung, wie beispielsweise die Initialisierung und/oder 
der Start von Konf igurationen. Des weiteren werden Status 
und/oder Fehlerzustande ausgetauscht- Interrupts ftir die 
Steuerung und Synchronisation zwischen den CT's und einer CPU 

15 k6nnen unterstiitzt werden. 

Das System-Interface kann VPU-interne Protokolle derart kon- 
vertieren, daii diese auf externe (Standard) -Protokolle umge- 
setzt werden <z. B. AMBA) - 

20 Es wird darauf hingewiesen, dafc es auch moglich 1st, Busin- 
terfaces, RAM-Zellen, I/O-Zellen und dergleichen als Teile 
(PAEs) einer VPU vorzusehen- Dies gilt auch dann, wenn diese 
Einheiten fur die Prozessor-Coprozessor-Kopplung verwendet 
werden sollen . 

25 

Ein bevorzugtes Verfahren zur Codegenerierung fiir das be- 

schriebene System ist in der Patentanmeldung. PACT 20 beschrie- 

ben^ die 2U Of f enbarungszwecken vollumf Snglich eingegliedert 

wird- Das Verfahren beschreibt einen Compiler, der Pro- 

30 grammcode in Code ftir eine CPU und Code ftir eine VPU zer- 

teilt. Nach unterschiedlichen Verfahren wird die Zerlegung 

auf die unterschiedlichen Prozessoren durchgefiihrt. In einer 

besonders bevorzugten Ausfiihren werden die jeweiligen zerleg- 
13 
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ten Codes um die Interf ace-Routinen zur Koinmunikation zwi- 
schen CPU und VPO erweitert. Die Erweiterung kann automatisch 
durch den Compiler erfolgen. 

5 Ein erf indungsgem^fier Vorteil ist, dass Verwaltungs- und/oder 
Interfaceaufwand sowie Programmierung des erf indungsgemali^n 
Systemes unaufwendig und einfach sind. 

Die nachf olgenden Tabellen zeigen beispielhafte Koirouinikatio- 
10 nen zwischen einer CPU und einer VFU. Den Spalten sind die 
jeweilig aktiven Funktionseinheiten zugeordnet: CPU, System- 
DMA und DMA-Interface (EDMA) bzw. Speicher-Interf ace (Spei- 
cher-I/F) r System-Interface (System-I/F, 0402), CT's, sowie 
die PAC. In den Zeilen sind die einzelnen Zyklen in ihrer 
J5 Ausftihrungsreihenfolge eingetragen. Kl referenziert eine aus- 
2Ufahrende Konf iguration 1. 

Die erste Tabelle zeigt beispielsweise einen Ablauf bei Ver- 
wendung der System-DMA (EDMA) zum Datentransfer . Jede 2eile 
20 zeigt einen sequentiell ablaufenden Steuervorgang; die Spai- 
ten zeigen die jeweilige Aktivitat in der entsprechenden Bau- 
gruppe: 



CPU 


EDMA 


System-I/F 


CT's 


PAC 


Initiiere 
Kl 












Lade Kl 








Starte Kl 






Konfiguriere 
Kl 




Initiiere 
laden der 
Daten per 




Starte Kl 




Wart en auf 
Daten 
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EDMA 










Initiiere 
lesen der 
Daten per 
EDMA 


Datentransfer 
lesen der Da- 
ten 






Datenver- 
arbeitung 




Datentransfer 
schreiben der 
Daten 


Signalisiere 
Ende der 
Operation 







Es ist zu erwahnen, dass die Synchronisation zwischen der ED- 
MA and der VPU automatisch tiber das Interface 0401 erfolgt, 
d.h. DMA-Tranfers finden nur statt, wenn die VPU daftar bereit 
ist. 



In einer zweiten Tabelle ist beispielsweise ein bevorzugter 
optimierter Ablauf dargestellt. Die VPU besitzt selbst direk- 
ten Zugriff auf den Konf igurationsspeicher (0306) . Des weite- 
ren werden die Datentransf ers durch DMA-Schaltung innerhalb 
der VPU ausgefiihrt, die beispielsweise fest implementiert 
sein konnen (PACT03) und/oder durch die Konf iguration von 
konfigurierbaren Teilen der PAC entstehen. 



CPU 


EDMA 


System-I/F 


CT's 


PAC 


Initiiere 
Kl 










Starte Kl 


Lesen der 
Konf iguration 




Konfiguriere 
Kl 






Datentransfer 
lesen der Da- 
ten 


Starte Kl 




Lese Daten 










Datenver- 
arbeitung 
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Datentransfer 


Signal! siere 




Schreibe 




schreiben der 


Ende der 




Daten 




Daten 


Operation 







Der Arbeits- und Synchronisationsauf wand fur die CPU ist mi- 
nimal, wodurch eine maximale Performance erreicht wird- 



5 Weiterhin kann das Verfahren vorsehen, mehrere Konf iguratio- 
nen auf unterschiedlichen Bereichen der VPU, also auf unter- 
schiedlichen PAEs zugleich, auszufuhren oder auf denselben 
Ressourcen zeitgemultiplext auszuftlhren. 

10 Insbesondere kann eine Art. "Double-Buffering" zur besonders 
einfachen und zugleich schnellen Rekonf iguration angewendet 
werden, in welchem eine Mehrzahl von VPUs vorgesehen sind, 
wobei ein Teil zu einem Zeitpunkt der VPUs rekonf iguriert 
werden kann, wahrend ein anderer Teil rechnet und moglicher- 

15 weise ein Weiterer inaktiv sein kann. Die Daten-, Trigger-, 

Status verbindungen etc. werden zwischen der Mehrzahl von VPUs 
geeignet ausgetauscht und ggf • durch adressierte Busse 
und/oder Multiplexer/Demultiplexer ehtsprechend der aktuell 
aktiven und/oder zu rekonf igurierenden VPUs verschaltet. 

20 

Samtliche erwahnten PACT Patentanmeldungen und deren Famili- 
enmitglieder sind zu Of f enbarungszwecken vollumf anglich ein- 
gegliedert . 

25 Beliebige weitere Ausgestaltungen und Kombinationen der er- 

lauterten Erfindungen sind moglich und einem Fachmann offen- 

sichtlich. Es sei in diesem Zusammenhang insbesondere er- 

wahnt, daG anstelle einer Kopplung einer VPU an einen CPU un- 

ter Verwendung der VPU als Koprozessor gleiohfalls eine sol- 

30 che Kopplung unter Verwendung der CPU als Koprozessor moglich 

16 
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ist. Ein solcher Fall ist insbesondare dann bevorzugt, um bei 
der Compilierung als Pragrammteile mit nur geringer Paralle- 
litat und/oder geringen Vektoranteilen erkannte Bef ehlsstruk- 
turen sequenziell abarbeiten zu lassen. Es ist dann insbesbn- 

5 dere mfcglich, dali die VPU uber Linklisten oder Tabellen die 
CPU aufruft* Die' Linklisten oder Tabellen konnen dabei etwa 
Information enthalten, die angibt, wo Daten zu holen sind, 
unter welcher Adresse die CPU auf von ihr abzuarbeitende Pro- 
gramminformation zugreifen kann usw. Die Abfrage, ob die CPU 

10 dann mit der Abarbeitung der von ihr auszuf ahrenden Programm- 
Teile fertig ist, kann wiederum iiber ein Polling oder dergl. 
geschehen. Auch hier ist es m5glich, das Betriebs system ein- 
zusetzen, um der CPU Aufgaben zuzuweisen und/oder die von ihr 
auszuf uhrenden Tasks zu uberwachen. Prinzipiell lassen sich 

is demnach alle beschriebenen Verf ahren sowohl far die Kopplung 
einer CPU an eine VPU als Coprozessor als auch umgekehrt ver- 
wenden. Wichtig kann dabei alleine warden, fur welche Art der 
Kopplung das Betriebssystem ausgelegt ist- Es sei darauf hin- 
gewiesen, dafi es insbesondere moglich ist, ein Betriebssystem 

20 vorzusehen, das eine wechselseitige Kopplung ermSglicht, also 
insbesondere wahlweise die CPU an die VPU bzw. Telle da von 
koppelt und umgekehrt. Letzteres ist etwa besonders vorteil- 
haft, wenn ganze Programmblocke mit uberwiegend sequenziellen 
1 Anteilen von der VPU als Host an die CPU als Koprozessor ab- 

25 gegebeil werden sollen und diese Programmblocke noch partiell 
stark vektoriellen oder parallelen Code aufweist, der von der 
• CPU quasi Rtickubertragen werden kann, insbesondere im Anspre- 
chen auf eine ermittelte derzeitige oder prognostizierte VPU- 
Last * 

30 
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Titel: Rekonf igurierbares System 



Pa t ent ansp r tiche 

5 

1. Datenverarbeitungssystem, dadurch gekenn2eichnet r dafi zu- 
mindest ein rekonf igurierbarer Prozessor mit einem Stan- 
dardprozessor (CPU) gekoppelt ist. 

10 2. Datenverarbeitungssystem nach Anspruch 1, dadurch gekenn- 
zeichnet, daB der rekonf igurierba.ro Prozessor als Copro- 
zessor angeordnet ist. 

3. Datenverarbeitungssystem nach einem der vorhergehenden 
15 Ansprtiche, dadurch gekennzeichnet f dafi ein Speicher- 

und/oder I/O-Kopplungsmittel zur Ankopplung von Standard- 
prozessor und rekonf igurierbarem.. Prozessor aneinander 
vorgesehen ist. 

20 4- Datenverarbeitungssystem nach einem der vorhergehenden 

Anspriiche/ dadurch gekennzeichnet , daii die Kopplungsmit- 
tel zur Ankopplung durch Cbertragung von Daten und/ oder 
Statusinformationen und/oder Konf igurationen ausgebildet 
sind. 



25 



30 



5. Datenverarbeitungssystem nach einem der vorhergehenden 
Anspriiche , dadurch gekennzeichnet, dafi die CPU und der 
rekonf igurierbare Prozessor und/oder deren Peripherie so 
ausgebildet sind, daJi sie auf zumindest einen Teil der 
ihnen zur Verfiigung stehenden Ressourcen und insbesondere 
auf einen Teil des Speicherbereiches gemeinsam zugreifen 
konnen. 

18 
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6. Datenverarbeitungssystem nach einem der vorhergehenden 
Ansprtiche, dadurch gekennzeichnet , dafl zur Synchronisati- 
on zwischen CPU und rekonf igurierbarem Prozessor zumin- 
dest eine ein- und/oder mehrseitige Interrupt-Leitung 
vorgesehen 1st. 

7. Datenverarbeitungssystem nach einem der vorhergehenden 
Ansprtiche, dadurch gekennzeichnet, daft der rekonf igurier- 
bare Prozessor eigene Konf iguratianslade- und/oder Kon- 
trollmittel aufweist, insbesondere zur zumindest partiel- 
len Neu- und/oder Umkonf iguration ohne CPU-Eingang wah- 
rend der Laufzeit* 

8. Ein auf einem Chip integriertes Datenverarbeitungssystem 
nach einem der vorhergehenden Anspriiche. 

9. Verfahren zur Datenverarbeitung mit einem rekonf igurier- 
baren und .einem Standard-P.ro2essor, worin der Standard- 
prozessor auf dem rekonf igurierbaren Prozessor auszufuh- 
rende Unterprogramme bzw. Unterprogrammteile aufruft und 
diese auf dem rekonf igurierbaren Prozessor ausgeftthrt 
werden oder umgekehrt. 

10. Datenverarbeitungsverfahren nach dem vorhergehenden An- 
spruch, dadurch gekennzeichnet , dafi beim Aufruf des re- 
konf igurierbaren Prozessors Steuerinf ormation generiert 
wird. 

11. Datenverarbeitungsverfahren nach dem vorhergehenden An- 

spruch f dadurch gekennzeichnet, daii die Steuerinf ormation 

als Tabelle generiert wird, die insbesondere die auszu- 

fiihrende Konf iguration und/oder Zeiger auf entsprechende 

Speicherstellen und/oder Datenquellen und/oder Operanden- 
19 



>inaiaid 'd -riNd-'iUd 



6T : 61 S002-d3S-60 



Speicherstellen und/oder Ergebnisdaten-Speicherstellen 
bzw. Zeiger darauf umfaSt- 



12. Verfahren zum Betrieb eines Datenverarbeitungssystems 

5 nach einem der vorhergehenden Verf ahrensansprtiche, worin 

bei Aufruf des Coprozessors eine Linkliste erstellt und 
vom rekonf igurierbaren Pro2essor abgearbeitet wird. 

13. Verfahren nach einem der vorhergehenden Verf ahrensansprii- 
10 che, dadurch gekennzeichnet , dafi die zwischen rekonfigu- 

rierbarem -und Standardprozessor ausgetauschten Informa- 
tionen eine Basisadresse eines Ladelogikspeicherbereiches 
zur Lokalisierung von Konf igurationen, eine Basisadresse 
von Datentransf ers, I/O-Adressen von Datentransf ers, Syn- 
15 chronisationsinf ormation, insbesondere betreffend Zurtick- 

setzen, Anhalten oder Starten der VPU, und/oder Statusin- 
formationen der VPU, insbesondere Fehler und/oder Zustan- 
de der Datenverarbeitung hetrifft- 



20 14. Verfahren zur Datenverarbeitung nach einem der vorherge- 
henden Verfahrensanspriiche, dadurch gekennzeichnet , dafi 
eine Synchronisation von CPU und VPU durch Polling von 
Statusdaten und/oder -inf ormationen und/oder durch eine 
Interruptsteuerung erfolgt. 



20 
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Titel: Rekonf igurierbares System 

Zusammenf assung 

5 

Ein rekonf igurierbarer Prozessor (VPU) wird in eine techni- 
sche Umgebung eindesignet, die einen Standardprozessor (CPU) 
besitzt, wie beispielsweise einen' DSP, RISC, CISC-Prozessor 
Oder (Mikro) -Kont roller aufweist. Das Design soli derart er- 

10 folgen, dass eine moglichst einfaehe und leistungsf ahige An- 
bindung besteht. Ein weiterer Aspekt ist die einfache Pro- 
grammierbarkeit des entstehenden Systems. Die Weiterverwen- 
dung bestehender Programme der CPU sowie die Codekompatibili 
tat und die einfache Integration der VPU in die bestehenden 

is Programme finden Berucksichtigung. 
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